1 Deskripsi

Visualisasi data adalah proses menyajikan data dalam bentuk visual, seperti grafik, diagram, peta, atau tabel interaktif, untuk mempermudah pemahaman, analisis, dan pengambilan keputusan. Tujuan utama dari visualisasi data adalah untuk mengungkap pola, tren, hubungan, atau wawasan yang mungkin sulit ditemukan dalam data mentah atau angka-angka. Dengan kata lain, tujuan visualisasi data adalah untuk mengubah data menjadi wawasan yang dapat diakses dan digunakan oleh siapa saja, baik untuk analisis, komunikasi, maupun pengambilan keputusan.

1.1 Outline Visualisasi Data

  • Pendahuluan
    • Tujuan Visualisasi: Mengapa visualisasi data ini dibuat? Apa yang ingin dicapai atau disampaikan?
    • Deskripsi Data: Apa data yang digunakan? Dari mana data berasal? Apa sumber datanya?
    • Pertanyaan Penelitian: Apa yang ingin dicari atau diuji dengan visualisasi ini? Misalnya, tren, perbandingan, atau hubungan antar variabel.
  • Jenis Visualisasi yang Digunakan
    • Grafik Univariat: Menjelaskan grafik yang digunakan untuk menggambarkan satu variabel, seperti histogram, boxplot, atau pie chart.
    • Grafik Bivariat: Menjelaskan grafik yang digunakan untuk menggambarkan hubungan antara dua variabel, seperti scatter plot atau bar chart berkelompok.
    • Grafik Multivariat: Menjelaskan grafik yang digunakan untuk menggambarkan lebih dari dua variabel, seperti bubble chart atau heatmap.
    • Grafik Interaktif: Jika digunakan, jelaskan grafik interaktif yang memungkinkan eksplorasi data lebih mendalam, seperti dashboard atau peta interaktif.
  • Desain Visualisasi
    • Pemilihan Warna: Apa alasan di balik pemilihan warna dalam grafik? Apakah warna yang digunakan memiliki arti tertentu (misalnya, warna untuk kategori, status, dll.)?
    • Skala dan Sumbu: Apakah skala data yang digunakan sesuai dengan jenis grafik? Misalnya, linear, logaritmik, atau kategorikal.
    • Label dan Judul: Apakah grafik memiliki label yang jelas, termasuk judul, label sumbu, dan keterangan (legend)?
    • Keterbacaan: Apakah visualisasi mudah dibaca dan dimengerti oleh audiens?
  • Analisis Data
    • Temuan Utama: Apa pola atau tren yang ditemukan dalam data? Misalnya, apakah ada hubungan antara dua variabel? Apakah ada nilai yang mencolok atau outlier?
    • Insight: Apa wawasan yang bisa diambil dari visualisasi ini? Bagaimana data bisa digunakan untuk membuat keputusan atau menjawab pertanyaan yang diajukan?
    • Kesimpulan: Apa yang bisa disimpulkan berdasarkan hasil visualisasi? Adakah rekomendasi yang dapat diberikan?

2 Macam-macam Grafik

Visualisasi Data memiliki berbagai macam grafik yang umum digunakan, Nah berikut ini adalah berbagai macam grafik yang umum digunakan dalam visualisasi data, beserta penjelasannya:

2.1 Grafik Univariat

Grafik Univariat digunakan untuk menganalisis satu variabel saja. Grafik ini memberikan informasi tentang distribusi atau frekuensi data dalam satu dimensi.

  1. Contoh Grafik Histogram:
  • Histogram: Menampilkan distribusi frekuensi dari satu variabel.

Contoh sederhana cara Membuat Grafik Histogram:

  • Read Data:
#Pertama membaca file .xlsx menggunakan readxl
#Jika belum menginstall bisa install di packages
library(readxl)
Data <- read_excel("Data.xlsx")
View(Data)
  • Code:
# Muat library ggplot2
library(ggplot2)
# Lalu buat plot Histogram
ggplot(data = Data, aes(x = Jumlah_anak)) +
  geom_histogram(binwidth = 1, color = "black", fill = "lightblue",linetype = "solid")+
  labs(title = "Histogram", x = "Jumlah Anak")

Keterangan:

  • ggplot(): Fungsi utama dari ggplot2 untuk membuat grafik.
  • data = Data: Menentukan sumber data yang akan digunakan (data frame bernama Data).
  • geom_histogram(): Menambahkan elemen histogram ke plot.
  • labs(): Digunakan untuk memberikan label pada grafik.

2.2 Grafik Bivariat

Grafik Bivariat digunakan untuk menganalisis hubungan antara dua variabel. Grafik ini berguna untuk melihat apakah ada korelasi atau asosiasi antara dua variabel.

  1. Contoh Grafik Bivariat:
  • BarChart (Kelompok): Menampilkan perbandingan antar kategori berdasarkan dua variabel, seperti perbandingan penjualan per wilayah dan produk.
  • LineChart (Dua Variabel): Menunjukkan tren dua variabel yang berhubungan, seperti tren penjualan dan biaya operasional dalam satu periode.

Contoh sederhana cara Membuat Grafik Barchart:

  • Read Data:
#Pertama membaca file .xlsx menggunakan readxl
#Jika belum menginstall bisa install di packages
library(readxl)
Data <- read_excel("Data.xlsx")
View(Data)
  • Code:
# Muat library ggplot2
library(ggplot2)
# Lalu buat plot Histogram
ggplot(data = Data, aes(x = Jumlah_anak, y = Benua, fill = Benua)) +
  geom_bar(stat = "identity") +
  labs(title = "Rata-rata Jumlah Anak tiap Benua", x = "Jumlah Anak", y = "Benua") +
  theme_minimal()

Keterangan:

  • ggplot(): Membuat plot dasar menggunakan dataset Data.
  • aes(): Mendefinisikan elemen estetika pada grafik.
  • geom_bar(): Membuat grafik batang (bar chart).
  • labs(): Menambahkan label pada grafik.
  • theme_minimal(): Memberikan tema minimalis pada grafik(tampilan yang bersih tanpa banyak garis dan warna).

Contoh sederhana cara Membuat Grafik Linechart:

  • Read Data:
#Pertama membaca file .xlsx menggunakan readxl
#Jika belum menginstall bisa install di packages
library(readxl)
Data <- read_excel("Data.xlsx")
View(Data)
  • Code:
# Muat library ggplot2
library(ggplot2)
# Lalu Membuat line chart
ggplot(data = subset(Data, Negara == "Afghanistan"), aes(x = Tahun, y = Angka_Harapan_Hidup)) +
  geom_line(linewidth = 1, color = "blue", size = 3) +
  labs(title = "Perubahan Angka Harapan Hidup di Afghanistan",
       x = "Tahun",
       y = "Angka Harapan Hidup") +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

# Mencoba pada tiap Benua
ggplot(data = Data, aes(x = Tahun, y = Angka_Harapan_Hidup)) +
  geom_line(aes(color = Benua), size = 1) +
  facet_wrap(~Benua) +
  labs(title = "Perubahan Angka Harapan Hidup Tiap Benua",
       x = "Tahun",
       y = "Angka Harapan Hidup",
       color = "Benua") +
  theme_minimal()

Keterangan

  • ggplot(): Membuat plot dasar menggunakan dataset Data.
  • aes(): Mendefinisikan elemen estetika pada grafik.
  • geom_line(): Membuat grafik garis (line chart).
  • labs(): Menambahkan label pada grafik.
  • facet_wrap(): Digunakan untuk membuat plot yang memecah data berdasarkan satu atau lebih variabel kategori.
  • theme_minimal(): Memberikan tema minimalis pada grafik(tampilan yang bersih tanpa banyak garis dan warna).

2.3 Grafik Multivariat

Grafik Multivariat digunakan untuk menganalisis lebih dari dua variabel. Grafik ini membantu melihat pola, hubungan, atau tren yang melibatkan lebih dari dua variabel sekaligus.

  1. Contoh Grafik Multivariat:
  • 3D Scatter Plot: Menampilkan tiga variabel dalam bentuk titik-titik di ruang tiga dimensi.
  • Heatmap: Menampilkan korelasi antar banyak variabel dengan intensitas warna, misalnya korelasi antar berbagai fitur dalam dataset.

Contoh Sederhana Cara Membuat Grafik 3D Scatter Plot:

  • Read Data:
#Pertama membaca file .xlsx menggunakan readxl
#Jika belum menginstall bisa install di packages
library(readxl)
Data <- read_excel("Data.xlsx")
View(Data)
  • Code:
#Muat Library plotly
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
# Membuat 3D scatter plot
plot_ly(data = Data, 
        x = ~Pendapatan_per_kapita, 
        y = ~Angka_Harapan_Hidup, 
        z = ~Jumlah_anak, 
        type = "scatter3d", 
        mode = "markers", 
        color = ~Benua,  # Warna berdasarkan benua
        size = ~Populasi,  # Ukuran titik berdasarkan populasi
        text = ~Negara)  # Menambahkan nama negara sebagai tooltip
## Warning: `line.width` does not currently support multiple values.
## Warning: `line.width` does not currently support multiple values.
## Warning: `line.width` does not currently support multiple values.
## Warning: `line.width` does not currently support multiple values.

2.4 Grafik Interaktif

Grafik Interaktif memungkinkan pengguna untuk berinteraksi langsung dengan visualisasi, seperti memfilter, memperbesar, atau memilih data tertentu untuk analisis lebih mendalam.

  1. Contoh Grafik Interaktif:
  • Interactive Dashboards: Gabungan berbagai grafik (seperti grafik garis, bar, pie, dll.) yang dapat disesuaikan dengan input pengguna.
  • Interactive Maps: Peta yang memungkinkan pengguna untuk mengeksplorasi data geografis secara interaktif, seperti peta suhu atau populasi berdasarkan wilayah.
  • Plotly atau Shiny: Alat untuk membuat grafik interaktif menggunakan bahasa pemrograman R, memungkinkan pengguna untuk berinteraksi dengan visualisasi.

Kesimpulan